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蛋白 质 结构 的 分 形 及 其 与 进化 关系 的 研究 
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A 摘要 本文 在 应 用 分 形 理论 对 蛋白 质 分 子 结构 的 分 形 进行 研究 的 基础 上 ， 丛 非 线性 角 弃 ， 就 

白质 多 肽 链 的 结构 与 分 形 以 及 球 罩 白 三 维 结构 的 分 形 与 进化 的 其 系 问 题 ， 进 行 了 理论 探讨 和 分 
析 。 作 者 认为 ， 分 形 理 论 的 原理 和 方法 在 上 述 研 究 领域 中 的 应 用 ， 不 仅 可 以 对 这 些 问题 的 复杂 性 
给 予 较 好 地 描述 ， 而 且 更 重要 的 是 ， 将 可 为 人 们 进一步 认识 生物 大 分 子 的 性 质 和 特征 提供 一 些 有 
益 的 启示 和 新 的 信息 ， 同 时 ， 还 可 为 非 线性 理论 在 结构 分 子 生物 学 研究 中 的 应 用 开辟 出 一 条 新 的 
途径 ， 


关键 词 FORE. 进化 ， 分 形 ， 非 线性 


近年 来 ， 不 少 人 已 从 实验 和 理论 两 个 方面 对 核酸 序列 的 结构 与 分 形 ， 核 酸 序列 的 进化 
与 分 形 以 及 蛋白 质 多 肤 链 的 结构 与 分 形 的 关系 等 问题 ， 进 行 了 研究 和 探讨 ， 并 且 获 得 了 一 
些 有 意义 的 结果 和 启示 。 然 而 ， 有 关 蛋 白质 结构 的 分 形 研究 也 还 存在 着 一 些 问题 ， 而 蛋白 
质 结构 分 形 与 其 进化 的 关系 问题 ， 则 至 今 未 见报 道 。 本 文 将 应 用 分 形 理论 的 原理 和 方法 ， 
DAR RAKE THAR, PLS PRM KAT Et. 


1 组 白 质 多 肘 链 的 结构 与 分 形 


1982 年 ，Havlin 等 基于 “布朗 运动 ?的 4 自 避 行走 (SAW)7? 模 型 ， 研 究 了 普通 多 聚 链 
的 分 形 并 建立 了 计算 其 局 域 分 维 的 方法 。Allen (1982) 在 假定 蛋白 质 的 主 链 构象 符合 
Koch 岛 模 型 的 边界 线 构 型 的 基础 上 ， 计 算 了 蛋白 质 的 分 维 。 此 后 ，Wagner 等 (1985) 
根据 他 们 所 建立 的 蛋白 质 的 平面 分 维 模型 以 及 Havlin 等 (1982) 的 方法 也 对 蛋白 质 的 分 
维 进行 了 计算 和 研究 。 由 于 在 这 些 研究 中 的 模型 是 人 为 假定 的 平面 模型 ， 因 而 ， 其 研究 结 
果 不 可 避免 地 会 与 肥 白 质 真实 空间 结构 的 分 形 有 一 定 的 耻 离 。 此 外 ， 当 我 们 用 Havlin 等 
的 方法 计算 蛋白 质 的 局 域 分 维 时 ， 发 现 他 们 的 方法 似乎 不 适 于 计算 肽 链 的 分 维 ， 因 为 无 法 
得 到 一 个 无 标 度 区 。 为 了 研究 蛋白 质 空间 结构 与 其 分 维 的 关系 ， 作 者 根据 分 形 理论 的 原理 
和 蛋白质 结构 研究 的 结果 ， 分 析 了 和 蛋白质 的 主 链 构 象 ， 发 现任 何 一 个 蛋白 分 子 的 主 链 ， 细 
胞 色素 c 的 主 链 (图 1，a)， 可 看 作 是 由 图 1，b 所 示 的 一 系列 立体 分 子 片 或 生成 元 相互 
连接 而 成 的 。 蛋 白质 结构 研究 的 结果 表明 ， 两 相 邻 氨基 酸 残 基 x- 碳 原子 间 的 距离 约 为 
0.38 nm。 因 此 ， 一 般 说 来 ， 在 分 子 片 ABC 中 ，AB BC，AB 与 BC 间 的 夹 角 6 的 值 为 
0”<8<180”， 分 子 片 的 端 距 AC 取决 于 9 的 大 小 。 由 于 在 构成 蛋白 质 主 链 的 各 分 子 片 
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中 ，9 是 可 以 变化 的 且 它 的 值 也 互 不 相同 ， 因 而 任 一 肽 链 的 空间 结构 均 可 被 看 作 是 由 若干 
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个 这 样 的 分 子 片 所 连接 而 成 。 为 此 ， 作 者 将 其 称 为 “蛋白 质 空间 结构 分 形 的 立体 分 子 片 模 
型 "(图 1，b)。 基 于 此 模型 ， 我 们 对 Havlin 等 的 方法 进行 了 改进 ， 得 到 下 列 计算 公式 


cl) 


图 1 


— ©), 


Duy (W)= 1n(Ry)y Z Inf) a (1) 
(Rede =1/(M-N)E E (Ruan da (2) 
lrn) =1/(M—-N)EZ E (Fitw) (3) 
N=] i-] 
(Risen) a 一 E [(X ,+ — X,)? 十 (Y +1 _ Y,)? +(Z 541 =A Bi (4) 
(rirn)y = Xen X) + (¥en Y +Z asn — Ze) I? 15) 
NK 
D;=1/ NKE Dy tN) (6) 
W-2 
NK=M/2 当 M 为 偶数 时 5 
NK=(M+1)/2 当 M 为 奇数 时 。 5 
KB, (R u 是 在 残 基数 为 M 的 


由 立体 分 子 片 所 构成 的 细胞 色素 c 
主 链 的 三 维 结构 


Fig.l Three-dimensional structure of cytochrome c 
backbone composed by molecular fragments 
a. 细胞 色素 c HEM Rithe polypeptide backbone 


conformation of cytochrome c) b 蛋白 主 链 分 形 的 
立体 分 子 片 模型 the Stereo Molecular Fragment (SMF) 
model of protein backbone fractals.); A. B, C 分 别 


表示 在 主 链 上 3 PHRMA. FA ABSBC, 


0° <d<180 ° (A, B and C show respectively 
the three linked « -C atoms in protein chain, 
and AB*BC,0° <8<180" ), 


某 一 肽 链 中 的 残 基数 为 六 的 片段 的 平均 
长 度 ; 《rw yw 是 平均 长 度 为 〈(Rw) a 
片段 的 平均 端 距 ) Rerum 是 残 基数 为 
M 的 肤 链 中 的 第 ?和 第 HNT a- 矶 原子 
HENKE; rana BRK E 
为 Rian) u 的 第 i 和 第 HN 个 a- 矶 原子 
间 的 距离 ; X Ya Zi 则 分 别 为 第 j 个 
x- 矶 原子 在 三 维 空间 中 的 原子 坐标 。 
根据 公式 《1) 一 《6)， 我 们 对 30 种 
蛋白 质 和 多 肽 三 维 结构 的 分 维 进 行 了 计 
算 ， 计 算 中 所 用 的 主 链 a- 碳 原子 的 三 维 
晶体 坐标 数据 ， 全 部 来 自 Brookhaven 的 
蛋白 质数 据 库 。 通 过 计算 ， 得 到 了 这 些 蛋 
白质 和 多 肽 在 三 维 空间 中 主 链 构 象 的 分 维 
(E 1)。 根 据 利 用 4 自 避 行走 (SAW) 模 
型 ?研究 获得 的 结果 ， 如 果 蛋 白质 链 的 构 
象 满足 SAW 模型 ， 则 有 DEH?) 3, 
并 且 当 d=2M, DX1,333; 而 当 d=3 
时 ，DD 产 1.667 CHavlin 等 ，1982)。 从 
Allen ¥ (1982) 对 一 些 含 铁 蛋白 质 的 分 
维 进行 研究 后 所 得 到 的 结果 也 可 以 看 出 ， 


其 分 维 在 1.34 一 1.76 之 间 ， 而 且 这 些 值 基本 上 趋 于 DX 1.667 F0 DA 1.333 两 个 极端 。 有 
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人 认为 ， 这 说 明了 蛋白 质 链 有 两 种 构象 ， 即 二 维 的 平面 型 和 三 维 的 线 团 型 ( 李 后 强 等 ， 
1989)。 我 们 的 计算 结果 表明 ， 蛋 白质 的 分 维 约 在 1.30 一 1.68 之 间 ， 因 此 ， 作 者 认为 ， 一 
方面 ， 蛋 白质 链 在 三 维 空间 中 的 行为 基本 上 符合 SAW 模型 ， 另 一 方面 ， 它 们 在 三 维 空间 
中 ,不仅 有 二 维 的 平面 型 和 三 维 的 线 团 型 ， 而 且 在 这 两 种 构象 之 间 ， 似 平 还 有 1 种 二 维 与 
三 维 混 合并 存 的 中 间 型 构象 ， 并 且 这 种 中 间 型 的 构象 ， 在 天 然 蛋 白质 中 占有 更 大 的 比例 。 
这 从 表 1 中 可 以 看 出 ， 除 去 多 肽 和 少数 蛋白 质 的 分 维 在 1.30 或 1.68 左右 外 ， 大 部 分 的 分 
维 是 在 1.50 一 1.60 左右 。 从 蛋白 质 三 维 结构 的 复杂 性 和 多 样 性 及 其 实际 情况 来 看 ， 我 们 
认为 ， 这 种 观点 也 许 更 为 合乎 起 辑 。 实 际 上 ， 在 许多 蛋白 质 的 天 然 结构 中 、， 不 仅 具 有 类 似 
平面 型 的 8- 片 层 结 构 ， 同 时 也 上 共有 类 似 线 困 型 的 wx- 螺旋 和 无 规 卷曲 等 结构 的 存在 。 此 
外 ， 由 于 蛋白 质 链 分 维 值 的 高 低 与 其 肽 链 的 伸展 程度 有 关 ， 肽 链 越 伸 展 其 分 维 值 越 低 ， 反 
之 ， 其 分 维 值 就 越 高 。 因 此 ， 在 蛋白 质 的 二 级 结构 中 ， 随 着 最 为 伸展 的 8- 折 登 的 增加 ， 
其 整 条 肽 链 的 分 维 值 恒 会 降低 。 而 在 蛋白 质 的 三 级 结构 中 ， 由 于 肽 链 存在 着 盘 绕 、 着 曲 和 
回 折 等 几 种 形式 ， 所 以 、 在 多 肽 链 形 成 三 级 结构 的 过 程 中 ， 无 论 哪 一 种 形式 的 增加 ， 都 会 
导致 其 Dy 值 的 增 大 。 因 此 ， 作 者 认为 。 在 三 维 空间 中 、 蛋 白质 多 肽 链 结构 的 行为 基本 上 
5 SAW 模型 所 描述 的 情况 相符 合 ， 并 且 ， 多 肘 链 结构 的 分 维 与 其 二 级 和 三 级 结构 都 有 着 
密切 的 关系 。 


Rl 一 些 蛋 白质 和 多 及 三 维 结构 的 分 维 (D) 


Tab.1 The fractal dimensions (D, ) of some protein three—dimensional structures 


编号 种 类 Dy 编号 种 类 D; 
1 Hpk A 1.3402 16 A 2 EAR x- 链 1.6005 
2 «(eae B 1.3165 17 Am EL AARS f- 链 1.5933 
30 ER 1.2980 19 ”人 胎儿 血红 蛋白 脱氧 y- 链 1.5926 
4 ARRIR A 1.5683 19 ABM mT EAY 1.5815 
5 BEBE SERRE S 1.4693 20 ERA EA 1.5669 
6 *ARRAR 1.6533 21 ， 抹 香 景 肌 红 蛋白 1.6081 
7 FRA BM 1 6000 22 PUA 1 6094 
8 KMRKRA 1.3070 23 BHRASAR 1.5688 
9 RRB 1.3066 24 A PL 1.6834 
10 FREAK 14946 25 ”氧化 态 细胞 色素 1,5429 
[lL +*+ B- REAR 1.6691 26 ”还 原 杰 细胞 色素 c 1.5407 
12 。 >x- 金 环 蛇毒 1.4722 27 ，” 氟 化 杰 细胞 色素 c 1.5491 
13 REHAGEA 1.6081 28 BCA coq 1.5842 
4 fh £7 a-t 1.6017 29 ”氢化 态 细 胞 色素 cs 1,5239 
15 met A RB -HE 1.5975 30 ”氧化 态 细胞 色素 bs 1.5281 


为 了 进一步 研究 蛋白 质 结构 的 分 维 与 其 二 级 结构 的 关系 ， 我 们 从 表 1 中 选择 了 10 种 
看 白质 ， 通 过 运用 修改 后 的 Chou 等 的 方法 〈 张 应 等 ，1985) 对 蛋白 质 的 二 级 结构 进行 了 
预测 、 并 对 其 二 级 结构 与 分 维 的 关系 进行 了 分 析 。 结 果 表 明 ， 蛋 白质 的 分 维 与 其 肽 链 的 转 
折 数 有 密切 的 关系 。 一 般 而 言 ， 肽 链 的 转折 越 多 其 分 维 值 也 越 大 : 如 果 两 肽 链 的 转折 数 相 
fl, Wl x- 螺 旋 数 目 大 的 肽 链 就 具 较 高 的 分 维 值 只 有 当 肽 链 的 转折 和 -螺旋 的 数目 都 相 
同时 ， 分 维 的 大 小 与 肽 链 8- 折 又 数 的 多 少 有 关 (22). 
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#2 一 些 蛋 白质 结构 的 分 维 与 其 二 级 结构 的 关系 
Tab.2 The relationship between fractal dimensions(D , ) of some protein structures 
with their secondary structures 


编号 种 类 D; 转折 数 aR ER 5- 片 层 数 
1 木瓜 蛋白 酶 1.6533 17 3 2 
2 氧化 杰 细 胞 色素 csso 1.5842 10 7 1 
3 4+ BPE A A 1.5683 8 4 5 
4 氧化 态 细胞 色素 c， 1.5491 7 6 2 
5 Wit RHA c 1.5429 7 4 2 
6 2b Ul as SHR c 1.5407 7 4 0 
q 氧化 态 细胞 色素 b, F 1.5281 6 5 4 
8 氧化 态 细 胞 色素 cm 1.5239 6 4 2 
9 “+ BB R R S 1.4693 4 3 5 

10 猪 松 弛 肽 点 1.3402 1 1 2 


2 球 蛋 白 分 子 三 维 结构 的 分 形 与 进化 


根据 公式 (1) — (6), 我们 对 11 种 血红 蛋白 和 了 肌 红 蛋 白 三 维 结 构 的 分 维 进行 了 计 
算 ， 闪 利用 这 些 蛋 白质 三 维 结构 的 分 维 《〈 表 3) 作为 指标 ， 应 用 公式 (7) 计算 了 这 些 蛋 
白质 三 维 结构 问 的 相似 件 ， 然 后 ， 通 过 运用 模糊 聚 类 分 析 靶 〈 黄 京 飞 等 ，1991) 建立 了 相 
应 的 系统 树 (图 3)。 
S, = (l-ID D; |) x100 (7) 
RE, S ) 是 蛋白 质 分 子 i 与 分 子 j 三 维 结构 间 的 相似 性 ， Ds 和 Dj /分 别 为 分 子 i 与 
分 子 j 主 链 结构 的 分 维 。 
表 3 一 些 球 蛋 白 三 维 结构 的 分 维 (DD) 
Tab. 3 The fractal dimensions (D, ) of some globe proteins 


编号 种 类 D; 
1 A ACRES ARS x- 链 1.600703 
2 人 一 氧化 碳 血 红 蛋 白 脱 氧 p- 链 1 595161 
3 人 胎儿 血红 蛋白 脱氧 “一 链 1.600474 
4 大 胎儿 血红 蛋白 脱氧 ;一 链 1 592640 
5 马 血 红 蛋 白 脱 氧 x- 链 1.601705 l 
6 马 血 红 蛋 白 脱 气 8 一 链 1.597548 
7 ABM fA V 1.581488 
8 MEME (Themiste dyscriten) 血红 蛋白 1.566893 
9 Fe (Chironomus thunmi thunmid WiL EA 1.583099 
10 RAMI HA 1.608133 
11 eS) WEL A 1.609397 





结果 表明 ， 根 据 蛋 白质 三 维 结构 的 分 维 建立 的 分 子 系统 树 与 通过 计算 蛋白 质 主 链 a- 
碳 原 子 间 距离 的 RMS ‘ 均 方 根 误差 ) 来 直接 对 其 三 维 结构 的 差异 进行 比较 后 所 获得 的 系 
统 树 (图 3) 基本 上 是 一 致 的 。 二 者 的 主要 区 别 在 于 ， 八 目 晶 血红 蛋白 V 在 系统 树 中 的 位 
置 。 生 物 系统 学 的 研究 表明 ， 生 物 的 进化 是 一 个 由 水 生 一 陆 生 、 无 痊 椎 动物 -> 疹 推 动物 以 
及 低 等 峭 椎 动物 一 高 等 脊椎 动物 〈 哺 乳 类 ) 一 灵 长 类 的 过 程 。 八 目 赐 与 属于 哺乳 类 的 凉 和 
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图 2 由 【9 种 球 蛋 白 三 维 结构 主 链 的 分 形 维 数 所 图 3 根据 球 蛋 白 三 维 结构 间 的 距离 所 构建 的 分 


构建 的 分 子 系统 树 子 系统 树 (Johnson 等 ，1990) 

Fig.2 Phylogenetic tree denved from fractal di- Fig.3 Phylogenetic tree derived from the dits- 

mensions 11 globin 3—D structures tances beiween globin 3-D structures (Johnson 
et al.. 1990} 


WSL, PDRBRARRHHA, Ain, EMSAM Se SMA Ko E R ie Pe 
鹏 为 远 ， 另 一 方面 ， 由 于 钙 和 海豹 的 肌 红 蛋白 与 人 和 马 的 血红 蛋白 在 结构 上 有 着 高 度 的 相 
似 性 ， 所 以 ， 语 和 海豹 也 应 与 人 和 马 有 着 较为 密切 的 关系 。 此 外 ， 海 生 蠕 虫 Temiste 
dyscritum 与 昆虫 、 鱼 类 和 哺乳 类 动物 相 比 是 较为 原始 的 种 类 ， 因 而 、 在 系统 树 中 ， 它 应 
与 上 述 的 后 几 类 动物 相距 较 远 而 位 于 另 一 分 枝 上 。 从 图 2 中 可 以 看 出 。 我 们 的 结果 与 上 述 
分 析 是 完全 吻合 的 ， 而 且 与 来 自 -- 级 结构 的 研究 结果 (Goodman 等 、1975; Feng 等 ， 
1987) 也 是 一 致 的 。 

根据 分 形 理论 的 观点 ， 作 者 认为 ， 在 分 子 进 化 与 生物 进化 之 间 应 具有 某 种 程度 的 自 相 
但 性 ， 即 生物 进化 中 的 某 些 特征 可 以 在 分 子 进化 的 过 程 中 得 到 反映 ， 同 样 ， 分 子 进化 的 一 
些 特 征 也 能 侣 在 生物 进化 的 过 程 中 得 到 反映 。 当 然 ， 自 相似 人 性 并 不 是 完全 等 同 ， 而 仅仅 是 
相似 ， 正 如 分 子 的 进化 与 生物 的 进化 既 有 相似 之 处 又 有 区 别 一 样 。 因 而 ， 利 用 分 维 作 为 一 
种 指标 来 探索 生物 大 分 子 间 的 进化 关系 ， 将 有 可 能 使 我 们 从 分 子 进化 的 研究 中 发 现 一 些 适 
于 生物 进化 的 规律 和 特征 。 生 物 系 统 学 和 分 子 系统 学 的 研究 表明 ， 无 论 是 在 个 体 还 是 分 子 
水 平 ， 生 物 的 进化 趋势 都 是 从 低 等 到 高 等 、 水 生 到 陆 生 、 无 峭 椎 动物 到 冰 椎 动物 以 及 低 等 
将 椎 动物 到 高 等 着 椎 动物 (哺乳 类 )， 作 者 认为 这 正 是 生物 进化 的 自 相 似 性 。 

分 形 理论 的 原理 和 方法 在 生物 大 分 子 结构 与 进化 关系 研究 领域 中 的 应 用 ， 不 仅 可 以 对 
这 些 问 题 的 复杂 性 给 予 较 好 的 描述 : 而 且 更 重要 的 是 ， 由 于 生物 系统 的 复杂 性 和 非 线 性 以 
及 生物 大 分 子 本 身 所 具有 的 分 形 性 ， 因 而 ， 这 种 理论 和 方法 的 应 用 将 可 为 人 们 进一步 认识 
生物 大 分 子 的 性 质 和 特征 提供 一 些 有 蔓 的 启示 和 新 的 信息 ， 同 时 ， 还 可 为 非 线性 理论 在 结 
构 分 子 生 物 学 研究 中 的 应 用 开辟 出 一 条 新 的 途径 : 
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STRUCTURAL FRACTALS AND EVOLUTION 
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Abstract 


This paper, based on using fractal theory to investigate the problem about protein struc- 
tural fractals, from the nonlinear angle, explored and analyzed the relations between protein 
polypeptide structure and fractal, and between globin three—dimensional structural fractal di- 
mensions and evolution, We suggest that not only the aspects can be discribed well by using 
fractal theory, but also it is more important that the fractal theory will probably offer the 
profitable enlightening and new information for people recognizing biological macromolecu— 
lar nature and feature because of the complexity and nonlinearity in biosystem and the 
fractal nature in biological macromolecule of itself contains fractal nature. On the other 
hand, it will also provide a new way for using the nonlinear theory into the field of structural 
molecular biology. 
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